Data Lake
データレイク_
構造化・非構造化を問わず、
Data Source
の生データをそのままコピーしたデータの置き場
Data Source
(水源)から流れてきたデータを蓄える場所なのでLake (湖)
Data Source
から
Data Lake
への変換
ETLツール
を使う
といってもTは不要だよね?
mrsekut.icon
例
Amazon S3 +
Amazon Athena
Azure Data Lake Storage
/mrsekut-book-4297124459/051: 1-5 データレイク層の一箇所にデータのソースのコピーを集約する